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(54) Title: SERINE PROTEINASE INHIBITORS 

(54) Bezeichnung: SERIN-PROTEINASE-INHIBITOREN 

(57) Abstract 

The invention relates to a serine proteinase inhibitor, characterised in that it has a domain with four cysteines, with a sequence of 13 
amino acids located between the firet cysteine and the second cysteine, a sequence of 18 amino acids located between the second cysteine 
and the third cysteine and a sequence of 2 amino acids located between the third cysteine and the fourth cysteine. The inventive serine 
proteinase inhibitors can be used for treating inflammatory diseases such as acute or chronic cervical inflammations or tonsillitis, and for 
preventing pulmonary emphysema. 

(57) Zusammenfassung 

Serin-Proteinase-lnhibitor, dadurch gekennzeichnet, dass der Serin-Proteinase-Inhibitor eine Domane mit vier Cysteinen enthalt, 
wobei sich zwischen dem ersten und zweiten Cystein eine Sequenz von 13 AminosSuren befindet, sich zwischen dem zweiten und dritten 
Cystein eine Sequenz von 18 Aminosauren befindet und sich zwischen dem dritten und vierter Cystein eine Sequenz von 2 Aminosauren 
befindet. Die Serin-Proteinase-Inhibitoren kGnnen far die Behandlung entzOndlicher Erkrankungen wie z.B. akuter oder chronischer 
Cervixentzundungen oder Tonsillitis verwandt werden sowie fur die Prophylaxe der Lungenemphysembildung. 
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Serin -Proteinase -Inhibitor en 

Die Erfindung betrifft Serin-Proteinase- Inhibitoren, cDNA 
kodierend f iir Serin-Proteinase - Inhibitoren , Arzneimittel 
enthaltend die Inhibitoren oder deren codierende Nuclein- 
saure, Verwendungen der erf indungsgemaSen Verbindungen zur 
Herstellung von Arzneimitteln zur Behandlung verschiedener 
Indikationen, Antikorper oder Antikorperf ragmente gegen 
Epitope der erf indungsgemaSen Verbindungen, Poly- oder 
Oligonucleotide, die mit Genen der erf indungsgemaSen Ver- 
bindungen hybridisieren, ein Diagnostikum zum Aufspiiren der 
erf indungsgemaSen Verbindungen, sowie Arzneimittel enthaltend 
Antikorper oder Poly- oder Oligonucleotide gemaS der Er- 
findung . 

Proteolytische Prozesse spielen in alien Organismen eine 
bedeutende physiologische Rolle, wobei zwischen un- 
spezif ischen und spezifischen proteolytischen Reaktionen zu 
unterscheiden ist. Zu den ersten gehoren beispielsweise der 
Nahrungsauf schluS im Verdauungstrakt durch Endopept idasen 
sowie der intrazellulare Abbau verbrauchter endogener 
Substanzen und phagozyt ierten Materials durch lysosomale 
Proteinasen. Spezifische Proteolysen dienen meistens der 
Uberfiihrung eines Proenzyms in die aktive Form wie bei der 



1 
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Uberfiihrung von Trypsinogen in Trypsin und Chymotrypsinogen 
in Chymotrypsin sowie bei den Kallikrein-Kinin-Kaskaden und 
der Blutgerinnungskaskade . Je nach Beschaf f enheit des re- 
aktiven Zentrums der daran beteiligten Proteinasen werden 
diese in die Klassen der Serin-Proteinasen (z.B. Chymo- 
trypsin, Trypsin, Elastase und Kathepsin G) , der Aspartat- 
Proteinasen (z.B. Kathepsin D, Kathepsin E und Pepsin) , der 
Cystein-Proteinasen (z.B. Kathepsin B, Kathepsin H und 
Kathepsin L) und der Metallo-Proteinasen (z.B. Kollagenase 
und Thermolysin) unterteilt. 



Urn die oft kaskadenartig verlaufenden proteolytischen 
Prozesse gegenregulieren zu konnen, verfiigt der Organismus 
iiber eine Reihe von anderen Proteinen, den Proteinase- Inhibi- 
toren (zur Ubersicht siehe Laskowski und Kato, 198 0 und Bode 
und Huber, 1992) . So schutzen die in der Leber syntheti- 
sierten, humanen Plasma- Proteinase -Inhibitoren ofi-Antichymo- 
trypsin und a^-Proteinase- Inhibitoren das Lungengewebe vor 
unspezif ischem Angriff durch die Proteinasen Kathepsin G bzw. 
Elastase aus polymorphkernigen Lymphozyten. Bei einem Un- 
gleichgewicht zwischen Proteinasen und ihren spezifischen 
Inhibitoren kann es zum Auftreten pathologischer Effekte 
kommen. Ein libermaSiges Verhaltnis von Elastase zu a^- 
Proteinase- Inhibitor erhoht beispielsweise bei Patienten mit 
genetisch bedingtem Mangel an diesem Faktor das Risiko der 
Bildung eines Lungenemphysems urn ca. 20 bis 30fach gegeniiber 
der Normalbevolkerung (Carrel und Owen, 1980) . Bei Rauchern 
wird die Emphysembildung mittels Oxidation der im reaktiven 
Zentrum des a^- Proteinase -Inhibitors befindlichen Aminosaure 
Methionin durch im Zigarettenrauch enthaltene Oxidantien 
begiinstigt (Miller und Kuschner, 1969; Ohlsson et al . , 1980) . 
Auch im Falle der Infektion mit Gram-negat iven Bakterien 
konnen deren Endotoxine eine Desintegrat ion von Phagozyten 
und damit die Ausschiittung lysosomaler Proteinasen verur- 
sachen, was durch den erhohten Verbrauch an Proteinase- 
Inhibitoren unkontrollierte Gewebsschadigung und Entziindungen 
verursachen kann. Aus diesem Grund besitzen bestimmte 
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Proteinase-Inhibitoren ein hohes therapeut isches Potential 
(siehe z.B. Fritz, 1980). 



Das der Erfindung zugrunde liegende technische Problem 
besteht darin, weitere Inhibitoren von Serin-Proteinasen zur 
Verfiigung zu stellen. Des weiteren sollten die fur die 
erf indungsgemaiSen Inhibitoren kodierenden Gene bzw. cDNA zur 
Verfiigung gestellt werden. 

Spezifisches Merkmal der erf indungsgemaSen Serin-Proteinase- 
Inhibitoren ist, dai^ der Serin-Proteinase-Inhibitor eine 
Domane mit vier Cysteinen aufweist und sich zwischen dem 
ersten und einem zweiten Cystein eine Sequenz von 0 bis 20 
Aminosauren befindet oder der Serin-Proteinase- Inhibitor eine 
Domane mit sechs Cysteinen aufweist und sich zwischen dem 
ersten und zweiten Cystein eine Sequenz von 7 bis 20 Amino- 
sauren befindet. 



Bevorzugterweise befindet sich zwischen einem ersten und 
einem zweiten Cystein eine Sequenz von 13 Aminosauren 
und/oder zwischen einem zweiten und einem dritten Cystein 
eine Sequenz von 18 Aminosauren und/oder zwischen einem 
dritten und vierten Cystein eine Sequenz von 2 Aminosauren. 

Es wird insbesondere bevorzugt, daS die Sequenz zwischen 
einem ersten und zweiten Cystein ausgewahlt wird aus 



HEFQAFMKNGKLF , 
DDFKKGERDGDFI , 
SAFRPFVRNGRLG, 
KEYEKQVRNGRLF , 
SQYQNQAKNGILF, 
NEYRKLVRNGKLA, 



SEYRKSRKNGRLF, 

SEFRDQVRNGTLI, 

SEYRHYVRNGRLP, 

DEFRRLLQNGKLF, 

AEYREQMKNGRLS oder 

DEFRSQMKNGKLI 



und/oder die Sequenz zwischen einem zweiten und dritten 
Cystein ausgewahlt wird aus 
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PQDKKFFQS LDG I MF I NK , 



TRENDPIQGPDGKMHGNT , 



TRENDPVLGPDGKTHGNK , 



TREHNPVRGPDGKMHGNK , 



TRESDPVRGPDGRMHGNK , 



TREND P I EGLDGK I HGNT , 
TREND PVRGPDGKTHGNK , 
TRESDPVRDADGKSYNNQ Oder 



TRENDP I RGPDGKMHGNL , 



TRENDPIQGPDGKVHGNT , 



TRESDPVRGPDGKTHGNK 



und/oder die Sequenz zwischen . einem dritten und vierten 
Cystein ausgewahlt wird aus 

AT, AL, AM, SM Oder TM . 

Besonders bevorzugt wird, daS der erf indungsgemaSe Serin- 
Proteinase- Inhibitor einer der Formeln 





-c- 


HEFQAFMKNGKLF- 


C- 


PQDKKFFQSLDGIMFINK- 


C- 


-AT- 


C 


-R2 


Ri 


-c- 


DDFKKGERDGDFI- 


c- 


PDYYEAVCGTDGKT YDNR - 


C- 


-AL- 


C- 


-R2 


Rx 


-c- 


■SAFRPFVRNGRLG- 


c- 


TRENDPVLGPDGKTHGNK - 


c- 


-AM- 


C 


-R2 


Ri 


-c- 


KEYEKQVRNGRLF - 


c- 


TRESDPVRGPDGRMHGNK- 


c- 


-AL- 


C 


-R2 


Ri 


-c- 


SQYQNQAKNGILF- 


c- 


• TRENDP I RGPDGKMHGNL - 


c- 


-SM- 


C 


-R2 


Ri 


-c- 


•NEYRKLVRNGKLA- 


c- 


■ TRENDP I QGPDGKVHGNT - 


c- 


-SM- 


C 


-R2 


Ri 


-c- 


•SEYRKSRKNGRLF- 


c- 


■ TRENDP I QGPDGKMHGNT - 


c- 


-SM- 


C 


-R2 


Ri 


-c- 


•SEFRDQVRNGTLI- 


■c- 


■ TREHNPVRGPDGKMHGNK - 


c- 


-AM- 


■C 


-R2 


Ri 


-c- 


' SEYRHYVRNGRLP - 


•c- 


• TRENDP I EGLDGKI HGNT - 


c 


-SM- 


c 


-R2 


Ri 


-c- 


-DEFRRLLQNGKLF- 


•c- 


- TRENDPVRGPDGKTHGNK - 


•c 


-AM- 


■c 


-R2 


Ri 


-c- 


-AEYREQMKNGRLS- 


-c- 


- TRESDPVRDADGKSYNNQ - 


■c 


-TM- 


c 


-R2 


Ri 


-c- 


■DEFRSQMKNGKLI- 


■c- 


- TRESDPVRGPDGKTHGNK - 


•c 


-TM- 


■c 


-R2 



worin R^ NH2, eine Aminosaure oder ein Peptid mit bis zu 100 
Aminosauren ist und R2 COOH, CONH2, eine Aminosaure oder ein 
Peptid mit bis zu 100 Aminosauren ist, entspricht. 

Es ist weiterhin bevorzugt, daS die Serin-Proteinase ein oder 
mehrere Disulf idbriicken auf weist . Dabei ist besonders bevor- 
zugt, daS er zwischen dem ersten und vierten Cystein und/oder 
dem zweiten und dritten Cystein eine Disulf idbriicke aufweist 
oder daS er zwischen dem ersten und fiinften Cystein und/oder 
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dem zweiten und vierten Cystein und/oder dem dritten und 
sechsten Cystein eine Disulf idbriicke auf weist . 

Bevorzugte Vertreter der erf indungsgemaSen Serin- Proteinase - 
Inhibitoren sind die Verbindungen HF 6479 und HF 7665 sowie 
Fragmente der Proteine VAKTI-1 und VAKTI-2 gemaS den Figuren 
1 und 2 . 

Aus den Figuren 1 bis 3 lassen sich neben der Aminosaurese- 
quenz der erf indungsgemaS bevorzugten Verbindungen auch 
weitere Inf ormationen beziiglich der cDNA, die fur die er- 
findungsgemafien Verbindungen kodiert, entnehmen. Insbesondere 
werden die entsprechenden Motive und Primer hybridisierenden 
Stellen angegeben. 

Die erf indungsgemaSe Verbindung HF 3479 weist eine Masse von 
6.479 Dalton auf, diejenige von HF 7665 betragt 7.665 Dalton, 
beide wurden aus Hamofiltrat auf gereinigt . 

Erf indungsgemaS beansprucht wird auch eine cDNA, kodierend 
fiir die erf indungsgemaSen Verbindungen, insbesondere eine 
cDNA mit der Nucleinsauresequenz gemaS Figuren 1 bis 2 . 

Die erf indungsgemaSen Verbindungen sind als Arzneimittel 
geeignet. Gegebenenf alls werden sie zusammen mit pharma- 
zeutisch vertraglichen Tragerstof f en appliziert. 

Die erf indungsgemaSen Arzneimittel enthaltend die erfindungs- 
gemaSen Proteinase- Inhibitoren werden vorzugsweise in Mengen 
von 1 bis 100 mg/kg Korpergewicht des Patienten verabreicht. 
Als Verabreichungsf orm kommen alle galenischen Zubereitungen 
fiir Peptidwirkstof f e in Frage . Die Arzneimittel enthaltend 
Nucleinsauren gemaS der Erfindung werden vorzugsweise in 
Mengen von 0,1 bis 100 mg/kg Korpergewicht eines entsprechen- 
den Patienten verabreicht. Hier kommen als galenische Ver- 
abreichungsf ormen solche in Betracht, die zur Applikation 
von Nucleinsauren geeignet sind, ohne daS die Nucleinsauren 
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vor Erreichen des Wirkortes durch Stof f wechseleinf liisse 
unwirksam gemacht warden. Als galenische Verabreichungsf orm 
konnen z.B. Liposomen eingesetzt warden, in denen die 
Nucleinsauren befindlich sind. 



Die erf indungsgemaSen Verbindungen kommen insbesondere zur 
Behandlung von akuten oder chronischen Cervixentziindungen, 
Entziindungen der Bartholinschen Driisen oder anderer vaginaler 
Bereiche, Tonsillitis, Pharyngitis und Laryngitis, mit exzes- 
siver Schleimbildung verbundener akut oder chronisch entzund- 
licher Prozesse und sich daraus ergebender akuter Not- 
situationen, postoperativer Blutungen aufgrund Hyper- 
fibrinolyse sowie zur Prophylaxe der Lungenemphysembildung 
bei Qfj^-Proteinase-Inhibitortnangel in Betracht. 

Die erf indungsgemalSen Verbindungen konnen bei Mangel an 
Serin-Proteinase-Inhibitoren verabreicht werden, um endogene 
Def izite auszugleichen. Die Nucleinsauren konnen, direkt oder 
an geeignete Vehikel gekoppelt, auch zum Einsatz in der 
Gentherapie gelangen. Als geeignete Vektoren kommen ins- 
besondere attenuierte Adenoviren, in die entsprechenden Gene 
inkorporiert werden, in Frage . 

Die erf indungsgemalSen Polypeptide, insbesondere VAKTI-I und 
VAKTI-II, konnen zur Herstellung von Antikorpern oder Anti- 
korperf ragmenten dienen. Diese werden in einfacher Weise 
durch Immunisierung geeigneter Sauger hergestellt. Durch an 
sich bekannte Operationen konnen die Antikorper auch humani- 
siert werden, so daS diese Antikorper ebenfalls zum thera- 
peutischen Einsatz gelangen konnen. Antikorper oder Anti- 
korper fragments konnen dann zur Regulation von Erkrankungen 
eingesetzt werden, bei denen die Proteinase- Inhibitoren 
pathologisch exprimiert werden. Ebenso konnen zu den er- 
f indungsgemaf?>en Nucleinsauren komplementare Ant i sense - 
Nucleinsauren zum therapeutischen Einsatz bei Uberexpression 
der Proteinase- Inhibitor-Genen eingesetzt werden. 
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Die erf indungsgemaSen Verbindungen sind in einfacher Weise 
durch an sich bekannte Methoden der Peptid- bzw, Nucleotid- 
synthese herstellbar. Einer gentechnischen Herstellung der 
Verbindungen steht ebenfalls nichts im Wege . 

Der Fachmann erkennt, daS bei den Polypeptiden gemalS der 
Erfindung auch Fragmente verwendet werden konnen, sofern sie 
die inhibitorischen Eigenschaf ten der Serin-Proteinase- 
Inhibitoren beibehalten. Das Auffinden solcher Fragmente ist 
dem Fachmann bekannt . So erfolgt dies beispielsweise durch 
gezielte enzymatische Spaltung der erf indungsgemaSen Ver- 
bindungen. Es konnen auch in den Seitenketten modifizierte 
Aminosauren eingesetzt werden. Auch N- und C- terminal modifi- 
zierte Polypeptide kommen in Betracht. Insbesondere konnen 
phosphorylierte, glycosylierte, methylierte, acetylierte oder 
in ahnlicher Weise modifizierte Polypeptide eingesetzt 
werden, sofern sie die Wirkung der Serin-Proteinase- In- 
hibitoren nicht relevant beeintracht igen , 

Bei den Nucleinsauren gemaS der Erfindung kommen auch 
Derivate in Betracht, die je nach Codon Usage modifizierte 
Tripletstrukturen aufweisen. Desweiteren sind als Nuclein- 
sauren gemaS der Erfindung auch solche zu verstehen, die 
durch Nucleasen gegenuber den nativen Verbindungen weniger 
stark abgebaut werden, beispielsweise die entsprechenden 
SODN-Derivate, die in der Antisense-Technologie iiblicherweise 
eingesetzt werden, urn die Antisense-Strukturen gegenuber 
enzymatischen Angriffen stabiler auszugestalten . 

Auch mit den Polypeptiden homologe Strukturen kommen in Be- 
tracht. Dies sind insbesondere Polypeptidstrukturen, bei 
denen Aminosauren ausgetauscht sind. So konnen beispielsweise 
konservative Aminosauresubst itutionen in hochkonservierten 
Regionen wie folgt beriicksicht igt werden: Jede Isoleucin-, 
Valin- und Leucin- Aminosaure kann gegen eine andere dieser 
Aminosauren ausgetauscht sein, Aspartat kann gegen Glutamat 
und umgekehrt ausgetauscht sein, Glutamin gegen Asparagin 
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und umgekehrt. Serin gegen Trionin und umgekehrt . Kon- 
servative Aminosauresubstitutionen in weniger hochkonser- 
vierten Regionen konnen wie folgt sein: Jede der Aminosauren 
Isoleucin, Valin und Leucin gegen jede andere Aminosauren, 
Aspartat gegen Glutamat und umgekehrt, Glutamin gegen 
Asparagin und umgekehrt, Serin gegen Theonin und umgekehrt, 
Glycin gegen Alanin und umgekehrt, Alanin gegen Valin und 
umgekehrt, Methionin gegen jede der Aminosauren Leucin, 
Isoleucin oder Valin, Lysin gegen Arginin und umgekehrt, eine 
der Aminosauren Aspartat oder Glutamat gegen eine der Amino- 
sauren Arginin oder Lysin, Histidin gegen eine der Amino- 
sauren Arginin oder Lysin, Glutamin gegen Glutamat und 
umgekehrt und Asparagin gegen Aspartat und umgekehrt . 

Die Wirkungsweise der erf indungsgemalSen Peptide wird durch 
das f olgende Beispiel erlautert . 

Beispiel 

Messung der Proteinase Inhibition durch HF 7665 
MelSansatz : 

84 ^1 MeSpuffer (0,1 M HEPES, pH 7.5; 0,5 M NaClJ 

1 fjil Trypsin (1 mg/ml in 1 mM HCl , 20 mM CaCl2) 

5 /il L-BABNA (6 mg/ml Na-Benzoyl -L-Arginine -p-Nitro- 

anilide Hydrochloride) 
10 /il Proteinase- Inhibitor (10 fiM bzw. 75 jig/ml HF 7665 

in H2O) . 

Die Reaktion wurde durch Zugabe des chromogenen Substrates 
gestartet und der Substratumsatz mittels Photometer bei X= 
405 nm verf olgt . Nach ca, fiinf Minuten wurden 10 /xl Pro- 
teinase- Inhibitor bzw. entsprechende Kontrollen dazugegeben 
und der weitere Ext inkt ionsverlauf beobachtet . 
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Es konnte gezeigt werden, daS HF 7665 in einer Endkonzen- 
tration von ca. 1 fiM bzw. 7,5 /xg/ml einen inhibitorischen 
Effekt auf Trypsin besitzt. Kontrollversuche mit entsprechen- 
den Mengen an BSA (7,5 /xg/ml) und Acetonitril/TFA (0,8% 
ACN/0,001% TFA) zeigten keine Trypsininhibierung . Weiterhin 
konnte kein inhibitorischer Effekt von HF 7665 auf Chymo- 
trypsin bei einem ahnlichen Test beobachtet werden. 

Figur 3 zeigt, dalS sich nach Zugabe von HF 7665 der 
Substratumsatz durch Trypsininhibierung urn ca . 30% ver- 
mindert . 
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Anspruche 



1. Serin-Proteinase- Inhibitor, dadurch gekennzeichnet, daS 
der Serin-Proteinase-Inhibitor eine Domane mit vier 
Cysteinen aufweist und sich zwischen dem ersten und 
zweiten Cystein der Domane eine Sequenz von 13 Amino- 
sauren, zwischen dem zweiten und dritten Cystein der 
Domane eine Sequenz von 18 Aminosauren und zwischen dem 
dritten und vierten Cystein der Domane eine Sequenz von 
2 Aminosauren bef indet . 



2. Serin-Proteinase-Inhibitor gemalS Anspruch 1, dadurch 
gekennzeichnet , daS die Sequenz der Domane zwischen dem 
ersten und dem zweiten Cystein ausgewahlt wird aus 



HEFQAFMKNGKLF , 
DDFKKGERDGDFI , 
SAFRPFVRNGRLG, 
KEYEKQVRNGRLF , 
SQYQNQAKNGILF, 
NEYRKLVRNGKLA, 



SEYRKSRKNGRLF , 
SEFRDQVRNGTLI, 
SEYRHYVRNGRLP , 
DEFRRLLQNGKLF, 
AEYREQMKNGRLS Oder 
DEFRSQMKNGKLI . 



3. Serin-Proteinase-Inhibitor gemaE einem der Anspruche 
1 und/oder 2, dadurch gekennzeichnet , dafi die Sequenz 
zwischen dem zweiten und dem dritten Cystein der Domane 
ausgewahlt wird aus 



PQDKKFFQSLDGIMFINK, 
TREND PVLGPDGKTHGNK , 
TRESDPVRGPDGRMHGNK , 
TRENDPIRGPDGKMHGNL , 
TRENDP I QGPDGKVHGNT , 
TRESDPVRGPDGKTHGNK . 



TRENDPIQGPDGKMHGNT , 
TREHNPVRGPDGKMHGNK , 
TRENDPIEGLDGKIHGNT, 
TREND PVRGPDGKTHGNK , 
TRESDPVRDADGKSYNNQ oder 



4. Serin-Proteinase-Inhibitor gemaS einem der Anspruche 
1 bis 3, dadurch gekennzeichnet , daB die Sequenz 
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zwischen dem dritten und dem vierten Cystein der Domane 
ausgewahlt wird aus 

AT, AL, AM, SM oder TM. 

5. Serin-Proteinase- Inhibitor gemaS einem der Anspriiche 
1 bis 4, mit einer der Formeln 





-c- 


■HEFQAFMKNGKLF- 


■C- 


-PQDKKFFQSLDGIMFINK- 


•C 


-AT- 


C- 


-R, 


Ri 


-c- 


■DDFKKGERDGDFI- 


■C- 


- PDYYE AVCGTDGKTYDNR - 


■C 


-AL- 


■C- 


•R2 


Ri 


-c- 


■SAFRPFVRNGRLG- 


•c- 


■ TREND PVLGPDGKTHGNK - 


■C 


-AM- 


•C- 


■R2 


Ri 


-c- 


KEYEKQVRNGRLF- 


c- 


■TRESDPVRGPDGRMHGNK- 


C 


-AL- 


C- 


•R2 


Ri 


-c- 


■SQYQNQAKNGILF- 


c- 


■TRENDPIRGPDGKMHGNL- 


C 


-SM- 


C- 


■R2 


Ri 


-c- 


NEYRKLVRNGKLA- 


c- 


■TRENDPIQGPDGKVHGNT- 


C- 


-SM- 


c- 


■R2 


Rx 


-c- 


SEYRKSRKNGRLF- 


c- 


TRENDPIQGPDGKMHGNT- 


c- 


-SM- 


c- 


R2 


Ri 


-c- 


SEFRDQVRNGTLI- 


c- 


TREHNP VRGPDGKMHGNK - 


c- 


-AM- 


c- 


R2 


Ri 


-c- 


SEYRHYVRNGRLP- 


c- 


TRENDPIEGLDGKIHGNT- 


c- 


-SM- 


c- 


R2 


Ri 


-c- 


DEFRRLLQNGKLF- 


c- 


TRENDPVRGPDGKTHGNK- 


c- 


~AM- 


c- 


R2 


Ri 


-c- 


AEYREQMKNGRLS- 


c- 


TRE S D P VRDADGKS YNNQ - 


c- 


-TM- 


c- 


R2 


Ri 


-c- 


DEFRSQMKNGKLI- 


c- 


TRESDPVRGPDGKTHGNK- 


c- 


-TM- 


c- 


R2 



worin R^ NH2, eine Aminosaure oder ein Peptid mit bis 
zu 1.000 Aminosauren ist und R2 COOH, CONH2/ eine Amino- 
saure oder ein Peptid mit bis zu 1.000 Aminosauren ist. 

6. Serin-Proteinase-Inhibitor gemalS mindestens einem der 
Anspriiche 1 bis 5, dadurch gekennzeichnet , daS 

er zwischen dem ersten und dem vierten Cystein 
und/oder dem zweiten und dem dritten Cystein eine 
Disulf idbriicke aufweist oder 

er zwischen dem ersten und dem funften und/oder 
dem zweiten und dem vierten und/oder dem dritten 
und dem sechsten Cystein eine Disulf idbriicke 
aufweist . 
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7. Serin-Proteinase-Inhibitor gemaS mindestens einem der 
Anspriiche 1 bis 6, dadurch gekennzeichnet , daS es 
sich um ein Fragment von VAKTI-1 (Seq. ID Nr. 1) oder 
VAKTI-2 (Seq. ID Nr. 2) handelt . 

8. Serin- Proteinase- Inhibitor gemafi Anspruch 7, dadurch 
gekennzeichnet , daS es sich um HF 6479 (Seq. ID Nr. 3) 
Oder HF 7665 (Seq. ID Nr. 4) handelt . 

9. Nucleinsaure, kodierend fur einen Serin-Proteinase- In- 
hibitor gemaS mindestens einem der Anspriiche 1 bis 8 . 

10. Arzneimittel enthaltend mindestens einen Serin-Pro- 
teinase- Inhibitor- gemaS mindestens einem der Anspriiche 
1 bis 8 und/oder eine Nucleinsaure gemaS Anspruch 9 
gegebenenf alls mit pharmazeutischen Tragerstof f en . 

11. Arzneimittel nach Anspruch 10, enthaltend 0,01 bis 
1.000 mg/kg Korpergewicht des Serin-Proteinase- Inhibi- 
tors nach mindestens einem der Anspriiche 1 bis 8 
und/oder der Nucleinsaure gemaS Anspruch 9. 

12. Verwendung des Serin-Proteinase-Inbibitors nach min- 
destens einem der Anspriiche 1 bis 8 zur Herstellung 
eines Arzneimittels zur Behandlung von akuten oder 
chronischen Cervixentziindungen , Entziindungen der 
Bartholinschen Driisen und anderer vaginaler Bereiche, 
Tonsillitis, Pharyngitis und Laryngitis, mit exzessiver 
Schleimbildung verbundener akut oder chronisch entziind- 
licher Prozesse und sich daraus ergebender akuter Not- 
situationen, postoperativer Blutungen aufgrund Hyper- 
fibrinolyse sowie zur Prophylaxe der Lungenemphysem- 
bildung bei a^- Proteinase- Inhibitormangel . 



13 . 



Verwendung der Nucleinsauren gemaiS Anspruch 9 zur 
Herstellung eines Arzneimittels zum Einsatz in der 
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Gentherapie zur Heilung und Prophylaxe von Erkrankungen 
gemaS Anspruch 12. 

14. Antikorper oder Antikorper-Fragmente gegen Epitope der 
Verbindungen nach einem der Anspriiche 1 bis 8. 

15. Poly- Oder Oligonucleotide, die mit Bereichen der cDNA 
Oder entsprechender RNA unter stringenten Bedingungen 
hybridisieren und gegebenenf alls die Expression 
codierender Bereiche der fur die Verbindungen nach 
Anspriichen 1 bis 8 codierenden Gene verhindern (Anti- 
sense Verbindungen) . 

16. Diagnostikum enthaltend mindestens eine der Verbin- 
dungen gemaE Anspruch 14 oder 15. 

17. Arzneimittel enthaltend mindestens eine der in den 
Anspriichen 14 und/oder 15 genannten Verbindungen in 
therapeutisch wirksamen Mengen. 

18. Verwendung der Verbindungen gemaS Anspruch 14 und/oder 
15 zur Herstellung eines Arzneimittels zur Behandlung 
von Erkrankungen, die mit einer zu hohen Expression der 
Verbindungen gemaiS mindestens einem der Anspriiche 1 bis 
8 Oder zu hohen Aktivitat der fiir die Verbindungen 
gemaE Anspriichen 1 bis 8 codierenden Bereichen ver- 
bunden sind. 

19. DNA kodierend fiir die in den Anspriichen 1 bis 8 genann- 
ten Verbindungen und/oder RNA, die in der Transcription 
Oder Translation der in den Anspriichen 1 bis 8 genann- 
ten Verbindungen beteiligt ist. 

20. DNA gemaS Anspruch 19 mit der Seq. ID Nr. 5 oder Seq. 
ID Nr. 6. 



wo 99/33974 



PCT/EP98/08424 



1/6 

Figur 1 

VAKTI-1 cDNA und Translation in Aminosauresequenz 

Frame 2 M K I A 

ATG CAT GGA GTG GAC CTG TAG GCG ACT TGC ATC GTC TTC AAC ATG AAG ATA GCC 
10 19 28 37 46 55 

I MEMC-l-> 

|->HF6479 

TVSVLLPLALCLIQDAASIKN 
ACA GTG TCA GTG CTT CTG CCC TTG GCT CTT TGC CTC ATA CAA GAT GCT GCC AGT AAG AAT 
64 73 82 91 100 109 



H^MC-l > CHEF-1- 



E DQEMCHEFQAFMKNGKLFC 
GAA GAT CAG GAA ATG TGC CAT GAA TTT CAG GCA TTT ATG AAA AAT GGA AAA CTG TTC TGT 
124 133 142 151 160 169 



-CHEF-14- 



CHEF-11 > <— — CHEF-2- 

PQDKKFFQSLDGIMFINKCA 
CCC CAG GAT AAG AAA TTT TTT CAA AGT CTT GAT GGA ATA ATG TTC ATC AAT AAA TGT GCC 
184 193 202 211 220 229 



-CHEF- 2 HF6479 <- 



T CKMI LEKEAKSQIKRARH LA 
ACG TGC AAA ATG ATA CTG GAA AAA GAA GCA AAA TCA CAG AAG AGG GCC AGG CAT TTA GCA 
244 253 262 271 280 289 

RAPKATAPTELNCDD FKKGE 
AGA GCT CCC AAG GCT ACT GCC CCA ACA GAG CTG AAT TGT GAT GAT TTT AAA AAA GGA GAA 
304 313 322 331 340 349 

RDGDFICPDYYEAVCGTDGK 
AGA GAT GGG GAT TTT ATC TGT CCT GAT TAT TAT GAA GCT GTT TGT GGC ACA GAT GGG AAA 
364 373 382 391 400 409 

TYDNRCALCAENAKTGSQIG 
ACA TAT GAC AAC AGA TGT GCA CTG TGT GCT GAG AAT GCG AAA ACC GGG TCC CAA ATT GGT 
424 433 442 451 460 469 

VKSEGECKSSNPEQVRSIVS 



GTA AAA AGT GAA GGG GAA TGT AAG AGC AGT AAT CCA GAG CAG GTG AGG TCA ATT GTC AGC 
484 493 502 511 520 529 

LMGNTGRLTSNSK STOP 

CTG ATG GGA AAT ACT GGG AGG CTA ACT TCA AAT AGT AAG TAG GTG CTG TCC TCT TCC TTC 
544 553 562 571 580 589 

TTA GGT GGG AGC CTT GGA AGG AAT TAA TTC TTG CTT TAT GTG AAA TGG AAT ACC CAG TTA 
604 613 622 631 640 649 

CTG CCC ACT AAT ATG AAA AAG CTA ATT ATA GTC TCT GAA ACT GGA TCA GAT TAC TTT GGT 
664 673 682 691 700 709 

GGT TAA GAT CTT TCA ATC TAT TGC TGC TTT GTA T 
724 733 742 749 
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Figur 2 ^ ' ^ 

VAKTI-2 cDNA und Translation in Amino sauresequenz 

Frame 2 M K I A 

ATG CAT GGA GTG GAC CTG TAG GCG ACT TGC ATC GTC TTC AAC ATG AAG ATA GCC 
10 19 28 37 46 55 

I — > HF 64 

TVSVLLPLALCLIQDAASIKN 
ACA GTG TCA GTG CTT CTG CCC TTG GCT CTT TGC CTC ATA CAA GAT GCT GCC AGT AAG AAT 
64 73 82 91 100 109 



Repeat 1 



E DQEMCHE FQAFiVIKNGKLFC 
GAA GAT CAG GAA ATG TGC CAT GAA TTT CAG GCA TTT ATG AAA AAT GGA AAA CTG TTC TGT 
124 133 142 151 160 169 

# 



p 


Q 


D 


K 


K 


F 


F 


Q 


S 


L 


D 


G 


I 


M 


F 


I 


N 


K 


C 


A 


CCC 


CAG 


GAT 


AAG 


AAA 


TTT 


TTT 


CAA 


AGT 


CTT 


GAT 


GGA 


ATA 


ATG 


TTC 


ATC 


AAT 


AAA 


TGT 


GCC 






184 






193 






202 






211 






220 






229 
























HF 6479 < — 1 
















T 


C 


K 


M 


I 


L 


E 


K 


E 


A 


K 


S 


Q 1 


K 


R 


A 


R 


H 


L 


A 


ACG 


TGC 


AAA 


ATG 


ATA 


CTG 


GAA 


AAA 


GAA 


GCA 


AAA 


TCA 


CAG 


AAG 


AGG 


GCC 


AGG 


CAT 


TTA 


GCA 






244 






253 






262 






271 






280 






289 






























Typische Kazal-Domane 






R 


A 


P 


K 


A 


T 


A 


P 


T 


E 


L 


N 


C 


D 


D 


F 


K 


K 


G 


E 


AGA 


GCT 


CCC 


AAG 


GCT 


ACT 


GCC 


CCA 


ACA 


GAG 


CTG 


AAT 


TGT 


GAT 


GAT 


TTT 


AAA 


AAA 


GGA 


GAA 






304 






313 


# 




322 






331 






340 
+ 






349 






R 


D 


G 


D 


F 


I 


C 


P 


D 


Y 


Y 


E 


A 


V 


C 


G 


T 


D 


G 


K 


AGA 


GAT 


GGG 


GAT 


TTT 


ATC 


TGT 


CCT 


GAT 


TAT 


TAT 


GAA 


GCT 


GTT 


TGT 


GGC 


ACA 


GAT 


GGG 


AAA 




J 


364 






373 
# 






382 






391 






400 






409 






T 


Y 


D 


N 


R 


C 


A 


L 


C 


A 


E 


.N 


A 


K 


T 


G 


S 


Q 


I 


G 


ACA 


TAT 


GAC 


AAC 


AGA 


TGT 


GCA 


CTG 


TGT 


GCT 


GAG 


AAT 


GCG 


AAA 


ACC 


GGG 


TCC 


CAA 


ATT 


GGT 






424 






433 






442 






451 






460 






469 


















+ 




















Repeat 2 
* 




V 


K 


S 


E 


G 


E 


C 


K 


S 


S 


N 


P 


E 


Q 


D 


V 


C 


S 


A 


F 


GTA 


AAA 


AGT 


GAA 


GGG 


GAA 


TGT 


AAG 


AGC 


AGT 


AAT 


CCA 


GAG 


CAG 


GAT 


GTA 


TGC 


AGT 


GCT 


TTT 






484 






493 






502 




# 


511 






520 






529 






R 


P 


F 


V 


R 


N 


G 


R 


L 


G 


C 


T 


R 


E 


N 


D 


P 


V 


L 


G 


CGG 


CCC 


TTT 


GTT 


AGA 


AAT 


GGA 


AGA 


CTT 


GGA 


TGC 


ACA 


AGG 


GAA 


AAT 


GAT 


CCT 


GTT 


CTT 


GGT 



544 



553 



562 



571 



580 



589 



K 



M 



K 



CCT GAT GGG AAG ACG CAT GGC AAT AAG TGT GCA ATG TGT GCT GAG CTG TTT TTA AAA GAA 



604 



613 



622 



631 



640 



649 



AENAKREGETRIRRNAEKDF 
GCT GAA AAT GCC AAG CGA GAG GGT GAA ACT AGA ATT CGA CGA AAT GCT GAA AAG GAT TTT 
664 673 682 691 700 709 



Repeat 3 



K 



K 



N 



R 



TGC AAG GAA TAT GAA AAA CAA GTG AGA AAT GGA AGG CTT TTT TGT ACA CGG GAG AGT GAT 



724 



733 



742 



751 



760 



769 



M 



H 



N 



K 



_# 
C^ 



CCA GTC CGT GGC CCT GAC GGC AGG ATG CAT GGC AAC AAA TGT GCC CTG TGT GCT GAA ATT 



784 



793 



802 



811 



820 



829 



FKRRFSEENSKTDQNLGKAE 
TTC AAG CGG CGT TTT TCA GAG GAA AAC AGT AAA ACA GAT CAA AAT TTG GGA AAA GCT GAA 
844 853 862 871 880 889 
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Repeat 4 
* 

EKTKVKREIVK L C S Q Y Q N Q A 
GAA AAA ACT AAA GTT AAA AGA GAA ATT GTG AAA CTC TGC AGT CAA TAT CAA AAT CAG GCA 
904 913 922 931 940 949 

# 

KNGILFCTRENDPIRGPDGK 
AAG AAT GGA ATA CTT TTC TGT ACC AGA GAA AAT GAC CCT ATT CGT GGT CCA GAT GGG AAA 

964 973 982 991 1000 1009 
# * 

MHGNLCSMCQVYFQAENEEK 
ATG CAT GGC AAC TTG TGT TCC ATG TGT CAA GTC TAC TTC CAA GCA GAA AAT GAA GAA AAG 
1024 1033 1042 1051 1060 1069 



I — > HF less 

KKAEARARNKRIESGKATSYA 
AAA AAG GCT GAA GCA CGA GCT AGA AAC AAA AGA GAA TCT GGA AAA GCA ACC TCA TAT GCA 
1084 1093 1102 1111 1120 1129 

Repeat 5 

* # 

ELCNEYRKLVRNGKLACTRE 
GAG CTT TGC AAT GAA TAT CGA AAG CTT GTG AGG AAC GGA AAA CTT GCT TGC ACC AGA GAG 

1144 1153 1162 1171 1180 1189 

# * 

N DP IQG PDGKVHGNTC SMCE 
AAC GAT CCT ATT CAG GGC CCA GAT GGG AAA GTG CAC GGC AAC ACC TGC TCC ATG TGT GAG 

1204 1213 1222 1231 1240 1249 

HF 7665 < i 

VFFQAEEEEKKKKEGESRNiK 
GTT TTT TTC C7^ GCA GAA GAA GAA GAA AAG AAA AAG AAG GAA GGC GAA TCA AGA AAC AAA 
1264 1273 1282 1291 1300 1309 

Repeat 6 



RQSKSTASFEELCSEYRKSR 
AGA CAA TCT AAG AGT ACA GCT TCC TTT GAG GAG TTG TGT AGT GAA TAC CGC AAA TCC AGG 

1324 1333 1342 1351 1360 1369 

# 

KNGRLFCTRENDPIQGPDGK 
AAA AAC GGA CGG CTT TTT TGC ACC AGA GAG AAT GAC CCC ATC CAG GGC CCA GAT GGG AAA 

1384 1393 1402 1411 1420 1429 
# * 

MHGNTCSMCEAFFQQEERAR 
ATG CAT GGC AAC ACC TGC TCC ATG TGT GAG GCC TTC TTT CAA CAA GAA GAA AGA GCA AGA 
1444 1453 1462 1471 1480 1489 

Repeat 7 



AKAKREAAKEICSEFRDQVR 
GCA AAG GCT AAA AGA GAA GCT GCA AAG GAA ATC TGC AGT GAA TTT CGG GAC CAA GTG AGG 

1504 1513 1522 1531 1540 1549 

# 

NGTLICTREHNPVRGPDGKM 
AAT GGA ACA CTT ATA TGC ACC AGG GAG CAT AAT CCT GTC CGT GGA CCA GAT GGC AAA ATG 

1564 1573 1582 1591 1600 1609 
# * 

HGNKCAMCASVFKLEEEEKK 
CAT GGA AAC AAG TGT GCC ATG TGT GCC AGT GTG TTC AAA CTT GAA GAA GAA GAG AAG AAA 
1624 1633 1642 1651 1660 1669 

NDKEEKGKVEAEKVKREAV Q 
AAT GAT AAA GAA GAA AAA GGG AAA GTT GAG GCT GAA AAA GTT AAG AGA GAA GCA GTT CAG 
1684 1693 1702 1711 1720 1729 

Repeat 8 

* # 

ELCSEYRHYVRNGRLFCTRE 
GAG CTG TGC AGT GAA TAT CGT CAT TAT GTG AGG AAT GGA CGA CTC CCC TGT ACC AGA GAG 
1744 1753 1*?62 1771 1780 1789 
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# * 

NDPIEGLDGKIHGNTCSMCE 
AAT GAT CCT ATT GAG GGT CTA GAT GGG AAA ATC CAC GGC AAC ACC TGC TCC ATG TGT GAA 
1804 1813 1822 1831 1840 1849 



AFFQQEAKEKERAEPRAKVK 
GCC TTC TTC CAG CAA GAA GCA AAA GAA AAA GAA AGA GCT GAA CCC AGA GCA AAA GTC AAA 
1864 1873 1882 1891 1900 1909 

Repeat 9 



REAEKETCDEFRRLLQNGKL 
AGA GAA GCT GAA AAG GAG ACA TGC GAT GAA TTT CGG AGA CTT TTG CAA AAT GGA AAA CTT 
1924 1933 1942 1951 1960 1969 

^ : 

F c TRENDPVRGPDGKTHGNK 
TTC TGC ACA AGA GAA AAT GAT CCT GTG CGT GGC CCA GAT GGC AAG ACC CAT GGC AAC AAG 
1984 1993 2002 2011 2020 2029 

C A M C KAVFQKENEERKRKEE 
TGT GCC ATG TGT AAG GCA GTC TTC CAG AAA GAA AAT GAG GAA AGA AAG AGG AAA GAA GAG 
2044 2053 2062 2071 2080 2089 



E DQRNA AGHGSSGGGGGNTQ 
GAA GAT CAG AGA AAT GCT GCA GGA CAT GGT TCC AGT GGT GGT GGA GGA GGA AAC ACT CAG 
2104 2113 2122 2131 2140 2149 

Repeat 10 

* # 

DECAEYREQMKNGRLSCTRE 
GAC GAA TGT GCT GAG TAT CGG GAA CAA ATG AAA AAT GGA AGA CTC AGC TGT ACT CGG GAG 
2164 2173 2182 2191 2200 2209 

# * 

S D P V R D A D G K S Y N N Q C T M C K 
AGT GAT CCT GTA CGT GAT GCT GAT GGC AAA TCG TAC AAC AAT CAG TGT ACC ATG TGT AAA 
2224 2233 2242 2251 2260 2269 



AKLEREAERKNEYSRSRSNG 
GCA AAA TTG GAA AGA GAA GCA GAG AGA AAA AAT GAG TAT TCT CGC TCC AGA TCA AAT GGG 
2284 2293 2302 2311 2320 2329 

Repeat 11 



TGSESGKDTCDEFRSQMKNG 
ACT GGA TCA GAA TCA GGG AAG GAT ACA TGT GAT GAG TTT AGA AGC CAA ATG AAA AAT GGA 
2344 2353 2362 2371 2380 2389 

# 

KLICTRESDPVRGPDGKTHG 
AAA CTT ATC TGC ACT CGA GAA AGT GAC CCT GTC CGG GGT CCA GAT GGC AAG ACA CAT GGT 
2404 2413 2422 2431 2440 2449 

# * 

N K C TMCKEKLEREAAEKKRK 
AAT AAG TGT ACT ATG TGT AAG GAA AAA CTG G7VA AGG GAA GCA GCT GAA AAA AAA AGA AAG 
2464 2473 2482 2491 2500 2509 



RMKTGAIQEKGAIQEKGAMT 
AGG ATG AAG ACA GGA GCA ATA CAG GAG AAA GGA GCA ATA CAG GAG AAA GGA GCA ATG ACA 
2524 2533 2542 2551 2560 2569 



KR ICVVNFEACREMESLSAP 
AAG AGG ATC TGT GTC GTG AAT TTC GAA GCA TGC AGA GAA ATG GAA AGC TTA TCT GCA CCA 
2584 2593 2602 2611 2620 2629 



wo 99/33974 



PCT/EP98/08424 



5/6 

EKI TLFEAHMARCTS INVLC 
GAG AAA ATA ACC CTG TTC GAG GCC CAT ATG GCA AGA TGC ACA TCA ATA AAT GTG CTA TGT 
2644 2653 2662 2671 2680 2689 

VRASLIEKLMKEKRKMKRNQ 
GTC AGA GCA TCT TTG ATC GAG AAG CTA ATG AAA GAA AAA AGA AAG ATG AAG AGA AAT CAA 
2704 2713 2722 2731 2740 2749 

VAS PQIMQRMSAVNFETX STOP 
GTA GCA AGC CCT CAA ATA ATG CAA AGG ATG AGT GCA GTG AAT TTC GAA ACT ATA TAA GGA 
2764 2773 2782 2791 2800 2809 



ACA ATG AAC TCA TCT GCC CTA GAG AGA ATG ACC CAG TGC ACG GTG CTG ATG GAA AGT TCT 
2824 2833 2842 2851 2860 2869 



ATA CAA ACA AGT GCT ACA TGT GCA GAG CTG TCT TTC TAA CAG AAG CTT TGG AAA GGG CAA 
2884 2893 2902 2911 2920 2929 



AGC TTC AAG AAA AAC CAT CCC ATG TTA GAG CTT CTC AAG AGG AAG ACA GCC CAG ACT CTT 
2944 2953 2962 2971 2980 2989 



TCA GTT CTC TGG ATT CTG AGA TGT GCA AAG ACT ACC GAG TAT TGC CCA GGA TAG GCT ATC 
3004 3013 3022 3031 3040 3049 



TTT GTC CAA AGG ATT TAA AGC CTG TCT GTG GTG ACG ATG GCC AAA CCT ACA ACA ATC CTT 
3064 3073 3082 3091 3100 3109 



GCA TGC TCT GTC ATG AAA ACC TGA TAG GCC AAA CAA ATA CAC ACA TCC GCA GTA CAG GGA 
3124 3133 3142 3151 3160 3169 



AGT GTG AGG AGA GCA GCA CCC CAG GAA CCA CCG CAG CCA GCA TGC CCC CGT TTG ACG AAT 
3184 3193 3202 3211 3220 3229 



GAC AGG AAG ATT GTT GAA AGC CAT GAG GGA AAA AAT AAA CCC CAG TTT TGA ATC ACC TAC 
3244 3253 3262 3271 3280 3289 



CTT CAC CAT CTG TAT ATA CAA AGA ATT TTT CGG AGC TTG TTT TAT TTG CTA TAG AAA ACA 
3304 3313 3322 3331 3340 3349 



ATA CAG AGC TTT TGG GAA TGG AAT CAC TGA TTT TCA GTC TTT TCC ATT TCT TTC CTC CTA 
3364 3373 3382 3391 3400 3409 



GAA TCT GTG ATC TGA GGG TAT AAA GAC ATT TCC ACC AAG TTT GAG CCC TCA AAA TGT CCT 
3424 3433 3442 3451 3460 3469 

Polyadenylierungssignal 
GAT TAC AAT GCT GTC TGT CCA ACT GCC TGT TC A ATA AAA GTA AAC TCA GCA GAA AAA .... 
3484 3493 3502 3511 3520 3529 



Pol V (Al -Tail 
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SEQUENZPROTOKOLL 



(1) ALLGEMEINE ANGABEN: 

(i) AX^ELDER: 

(A) NAME: Prof. Dr. Wolf-Georg Forssmann 

(B) STRASSE: Feodor-Lynen-Str . 31 

(C) ORT: Hannover 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: 3062 5 

(ii) BEZEICHNUNG DER ERFINDUNG: Serin-Proteinase- Inhibi toren 
(iii) ANZAHL DER SEQUENZEN : 34 

(iv) COMPUTER -LESBARE FASSUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentin Release 1*1.0, Version #1.30 (EPA) 



(2) ANG7VBEN ZU SEQ ID NO: 1: 

( i ) SEQUENZKENNZEICHEN : 

CA) LANGE: 177 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 1: 

Met Lys lie Ala Thr Val Ser Val Leu Leu Pro Leu Ala Leu Cys Leu 
15 10 15 

He Gin Asp Ala Ala Ser Lys Asn Glu Asp Gin Glu Met Cys His Glu 
20 25 30 

Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys 
35 40 45 

Lys Phe Phe Gin Ser Leu Asp Gly He Met Phe He Asn Lys Cys Ala 
50 55 60 

Thr Cys Lys Met He Leu Glu Lys Glu Ala Lys Ser Gin Lys Arg Ala 
65 70 75 80 

Arg His Leu Ala Arg Ala Pro Lys Ala Thr Ala Pro Thr Glu Leu Asn 
85 90 95 

Cys Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe He Cys Pro 
100 105 110 

Asp Tyr Tyr Glu Ala Val Cys Gly Thr Asp Gly Lys Thr Tyr Asp Asn 
115 120 125 

Arg Cys Ala Leu Cys Ala Glu Asn Ala Lys Thr Gly Ser Gin He Gly 
130 135 140 

Val Lys Ser Glu Gly Glu Cys Lys Ser Ser Asn Pro Glu Gin Val Arg 
145 150 155 160 



f 
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Ser lie Val Ser Leu Met Gly Asn Thr Gly Arg Leu Thr Ser Asn Ser 
165 170 175 

Lys 

(2) ANGABEN ZU SEQ ID NO: 2: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 922 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Lys lie Ala Thr Val Ser Val Leu Leu Pro Leu Ala Leu Cvs Leu 
1 ' 5 10 15 

lie Gin Asp Ala Ala Ser Lys Asn Glu Asp Gin Glu Met Cys His Glu 
20 25 30 

Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys 
35 40 45 

Lys Phe Phe Gin Ser Leu Asp Gly lie Met Phe lie Asn Lys Cys Ala 
50 55 60 

Thr Cys Lys Met lie Leu Glu Lys Glu Ala Lys Ser Gin Lys Arg Ala 
65 70 75 80 

Arg His Leu Ala Arg Ala Pro Lys Ala Thr Ala Pro Thr Glu Leu Asn 
85 90 95 

Cys Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie Cys Pro 
100 105 110 

Asp Tyr Tyr Glu Ala Val Cys Gly Thr Asp Gly Lys Thr Tyr Asp Asn 
115 120 125 

Arg Cys Ala Leu Cys Ala Glu Asn Ala Lys Thr Gly Ser Gin lie Gly 
130 135 140 

Val Lys Ser Glu Gly Glu Cys Lys Ser Ser Asn Pro Glu Gin Asp Val 
145 150 155 160 

Cys Ser Ala Phe Arg Pro Phe Val Arg Asn Gly Arg Leu Gly Cys Thr 
165 170 175 

Arg Glu Asn Asp Pro Val Leu Gly Pro Asp Gly Lys Thr His Gly Asn 
180 185 190 

Lys Cys Ala Met Cys Ala Glu Leu Phe Leu Lys Glu Ala Glu Asn Ala 
195 200 205 

Lys Arg Glu Gly Glu Thr Arg lie Arg Arg Asn Ala Glu Lys Asp Phe 
210 215 220 

Cys Lys Glu Tyr Glu Lys Gin Val Arg Asn Gly Arg Leu Phe Cys Thr 
225 230 235 240 
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Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Arg Met His Gly Asn 
245 250 255 

Lys Cys Ala Leu Cys Ala Glu lie Phe Lys Arg Arg Phe Ser Glu Glu 
260 265 270 

Asn Ser Lys Thr Asp Gin Asn Leu Gly Lys Ala Glu Glu Lys Thr Lys 
275 280 285 

Val Lys Arg Glu lie Val Lys Leu Cys Ser Gin Tyr Gin Asn Gin Ala 
290 295 300 

Lys Asn Gly lie Leu Phe Cys Thr Arg Glu Asn Asp Pro lie Arg Glv 
305 310 315 320 

Pro Asp Gly Lys Met His Gly Asn Leu Cys Ser Met Cys Gin Val Tyr 
325 330 335 

Phe Gin Ala Glu Asn Glu Glu Lys Lys Lys Ala Glu Ala Arg Ala Arg 
340 345 350 

Asn Lys Arg Glu Ser Gly Lys Ala Thr Ser Tyr Ala Glu Leu Cys Asn 
355 360 365 

Glu Tyr Arg Lys Leu Val Arg Asn Gly Lys Leu Ala Cys Thr Arg Glu 
370 375 380 

Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Val His Gly Asn Thr Cys 
385 390 395 400 

Ser Met Cys Glu Val Phe Phe Gin Ala Glu Glu Glu Glu Lys Lys Lys 
405 410 415 

Lys Glu Gly Glu Ser Arg Asn Lys Arg Gin Ser Lys Ser Thr Ala Ser 
420 425 430 

Phe Glu Glu Leu Cys Ser Glu Tyr Arg Lys Ser Arg Lys Asn Gly Arg 
435 440 445 

Leu Phe Cys Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys 
450 455 460 

Met His Gly Asn Thr Cys Ser Met Cys Glu Ala Phe Phe Gin Gin Glu 
465 470 475 480 

Glu Arg Ala Arg Ala Lys Ala Lys Arg Glu Ala Ala Lys Glu lie Cys 
485 490 495 

Ser Glu Phe Arg Asp Gin Val Arg Asn Gly Thr Leu lie Cys Thr Arg 
500 505 510 

Glu His Asn Pro Val Arg Gly Pro Asp Gly Lys Met His Gly Asn Lys 
515 520 525 

Cys Ala Met Cys Ala Ser Val Phe Lys Leu Glu Glu Glu Glu Lys Lys 
530 535 540 

Asn Asp Lys Glu Glu Lys Gly Lys Val Glu Ala Glu Lys Val Lys Arg 
545 550 555 560 

Glu Ala Val Gin Glu Leu Cys Ser Glu Tyr Arg His Tyr Val Arg Asn 
565 570 575 

Gly Arg Leu Pro Cys Thr Arg Glu Asn Asp Pro lie Glu Gly Leu Asp 
580 585 590 
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Gly Lys lie His Gly Asn Thr Cys Ser Met Cys Glu Ala Phe Phe Gin 
595 600 605 

Gin Glu Ala Lys Glu Lys Glu Arg Ala Glu Pro Arg Ala Lys Val Lys 
610 615 620 

Arg Glu Ala Glu Lys Glu Thr Cys Asp Glu Phe Arg Arg Leu Leu Gin 
625 630 635 640 

Asn Gly Lys Leu Phe Cys Thr Arg Glu Asn Asp Pro Val Arg Gly Pro 
645 650 655 

Asp Gly Lys Thr His Gly Asn Lys Cys Ala Met Cys Lys Ala Val Phe 
660 665 670 

Gin Lys Glu Asn Glu Glu Arg Lys Arg Lys Glu Glu Glu Asp Gin Arg 
675 680 685 

Asn Ala Ala Gly His Gly Ser Ser Gly Gly Gly Gly Gly Asn Thr Gin 
690 695 700 

Asp Glu Cys Ala Glu Tyr Arg Glu Gin Met Lys Asn Gly Arg Leu Ser 
705 710 715 720 

Cys Thr Arg Glu Ser Asp Pro Val Arg Asp Ala Asp Gly Lys Ser Tyr 
725 730 735 

Asn Asn Gin Cys Thr Met Cys Lys Ala Lys Leu Glu Arg Glu Ala Glu 
•740 745 750 

Arg Lys Asn Glu Tyr Ser Arg Ser Arg Ser Asn Gly Thr Gly Ser Glu 
755 760 765 

Ser Gly Lys Asp Thr Cys Asp Glu Phe Arg Ser Gin Met Lys Asn Gly 
770 775 780 

Lys Leu lie Cys Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly 
785 790 795 800 

Lys Thr His Gly Asn Lys Cys Thr Met Cys Lys Glu Lys Leu Glu Arg 
805 810 815 

Glu Ala Ala Glu Lys Lys Arg Lys Arg Met Lys Thr Gly Ala lie Gin 
820 825 830 

Glu Lys Gly Ala lie Gin Glu Lys Gly Ala Met Thr Lys Arg lie Cys 
835 840 845 

Val Val Asn Phe Glu Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro 
850 855 860 

Glu Lys lie Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser lie 
865 870 875 880 

Asn Val Leu Cys Val Arg Ala Ser Leu lie Glu Lys Leu Met Lys Glu 
885 890 895 

Lys Arg Lys Met Lys Arg Asn Gin Val Ala Ser Pro Gin lie Met Gin 
900 905 910 

Arg Met Ser Ala Val Asn Phe Glu Thr lie 
915 920 
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(2) ANGABEN ZU SEQ ID NO: 3: 

( i ) SEQUENZKENN2EICHEN : 

(A) LANGE : 55 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) MIT DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 3: 

Lys Asn Glu Asp Gin Glu Met Cys His Glu Phe Gin Ala Phe Met Lys 
15 10 15 

Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys Lys Phe Phe Gin Ser Leu 
20 25 30 

Asp Gly lie Met Phe lie Asn Lys Cys Ala Thr Cys Lys Met lie Leu 
35 40 45 

Glu Lys Glu Ala Lys Ser Gin 
50 55 

(2) ANGABEN ZU SEQ ID NO: 4: 

( i ) SEQUENZKENN2EICHEN : 

(A) LANGE: 68 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID 

Glu Ser Gly Lys Ala Thr Ser Tyr 
1 5 

Lys Leu Val Arg Asn Gly Lys Leu 
20 

lie Gin Gly Pro Asp Gly Lys Val 
35 40 

Glu Val Phe Phe Gin Ala Glu Glu 
50 55 

Glu Ser Arg Asn 
65 

(2) ANGABEN ZU SEQ ID NO: 5: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 748 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: cDNA 



NO: 4: 

Ala Glu Leu Cys Asn Glu Tyr Arg 
10 15 

Ala Cys Thr Arg Glu Asn Asp Pro 
25 30 

His Gly Asn Thr Cys Ser Met Cys 
45 

Glu Glu Lys Lys Lys Lys Glu Gly 
60 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 5: 



ATGCATGGAG 


TGGACCTGTA 


GGCGACTTGC 


ATCGTCTTCA 


ACATGAAGAT 


AGCCACAGTG 


60 


TCAGTGCTTC 


TGCCCTTGGC 


TCTTTGCCTC 


ATACAAGATG 


CTGCCAGTAA 


GAATGAAGAT 


120 


CAGGAAATGT 


GCCATGAATT 


TCAGGCATTT 


ATGAAAAATG 


GAAAACTGTT 


CTGTCCCCAG 


180 


GATAAGAAAT 


TTTTTCAAAG 


TCTTGATGGA 


ATAATGTTCA 


TCAATAAATG 


TGCCACGTGC 


240 


AAAATGATAC 


TGGAAAAAGA 


AGCAAAATCA 


CAGAAGAGGG 


CCAGGCATTT 


AGCAAGAGCT 


300 


CCCAAGGCTA 


CTGCCCCAAC 


AGAGCTGAAT 


TGTGATGATT 


TTAAAAAAGG 


AGAAAGAGAT 


360 


GGGGATTTTA 


TCTGTCCTGA 


TTATTATGAA 


GCTGTTTGTG 


GCACAGATGG 


GAAAACATAT 


420 


GACAACAGAT 


GTGCACTGTG 


TGCTGAGAAT 


GCGAAAACCG 


GGTCCCAAAT 


TGGTGTAAAA 


480 


AGTGAAGGGG 


AATGTAAGAG 


CAGTAATCCA 


GAGCAGGTGA 


GGTCAATTGT 


CAGCCTGATG 


540 


GGAAATACTG 


GGAGGCTAAC 


TTCAAATAGT 


AAGTAGGTGC 


TGTCCTCTTC 


CTTCTTAGGT 


600 


GGGAGCCTTG 


GAAGGAATTA 


ATTCTTGCTT 


TATGTGAAAT 


GGAATACCCA 


GTTACTGCCC 


660 


ACTAATATGA 


AAAAGCTAAT 


TATAGTCTCT 


GAAACTGGAT 


CAGATTACTT 


TGGTGGTTAA 


720 


GATCTTTCAA 


TCTATTGCTG 


CTTTGTAT 








748 


(2) ANGABEN ZU SEQ ID 


NO: 6 : 











( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 3531 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : cDNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

ATGCATGGAG TGGACCTGTA GGCGACTTGC ATCGTCTTCA ACATGAAGAT AGCCACAGTG 60 

TCAGTGCTTC TGCCCTTGGC TCTTTGCCTC ATACAAGATG CTGCCAGTAA GAATGAAGAT 12 0 

CAGGAAATGT GCCATGAATT TCAGGCATTT ATGAAAAATG GAAAACTGTT CTGTCCCCAG 180 

GATAAGAAAT TTTTTCAAAG TCTTGATGGA ATAATGTTCA TCAATAAATG TGCCACGTGC 2 40 

AAAATGATAC TGGAAAAAGA AGCAAAATCA CAGAAGAGGG CCAGGCATTT AGCAAGAGCT 3 00 

CCCAAGGCTA CTGCCCCAAC AGAGCTGAAT TGTGATGATT TTAAAAAAGG AGAAAGAGAT 360 

GGGGATTTTA TCTGTCCTGA TTATTATGAA GCTGTTTGTG GCACAGATGG GAAAACATAT 42 0 

GACAACAGAT GTGCACTGTG TGCTGAGAAT GCGAAAACCG GGTCCCAAAT TGGTGTAAAA 4 80 

AGTGAAGGGG AATGTAAGAG CAGTAATCCA GAGCAGGATG TATGCAGTGC TTTTCGGCCC 54 0 

TTTGTTAGAA ATGGAAGACT TGGATGCACA AGGGAAAATG ATCCTGTTCT TGGTCCTGAT 60 0 

GGGAAGACGC ATGGCAATAA GTGTGCAATG TGTGCTGAGC TGTTTTTAAA AGAAGCTGAA 660 
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AATGCCAAGC GAGAGGGTGA AACTAGAATT CGACGAAATG CTGAAAAGGA TTTTTGCAAG 720 

GAATATGAAA AACAAGTGAG AAATGGAAGG CTTTTTTGTA CACGGGAGAG TGATCCAGTC 780 

CGTGGCCCTG ACGGCAGGAT GCATGGCAAC AAATGTGCCC TGTGTGCTGA AATTTTCAAG 84 0 

CGGCGTTTTT CAGAGGAAAA CAGTAAAACA GATCA7VAATT TGGGAAAAGC TGAAGAAAAA 900 

ACTAAAGTTA AAAGAGAAAT TGTGAAACTC TGCAGTCAAT ATCAAAATCA GGCAAAGAAT 960 

GGAATACTTT TCTGTACCAG AGAAAATGAC CCTATTCGTG GTCCAGATGG GAAAATGCAT 1020 

GGCAACTTGT GTTCCATGTG TCAAGTCTAC TTCCAAGCAG AAAATGAAGA AAAGAAAAAG 1080 

GCTGAAGCAC GAGCTAGAAA CAAAAGAGAA TCTGGAAAAG CAACCTCATA TGCAGAGCTT 114 0 

TGCAATGAAT ATCGAAAGCT TGTGAGGAAC GGAAAACTTG CTTGCACCAG AGAGAACGAT 12 00 

CCTATTCAGG GCCCAGATGG GAAAGTGCAC GGCAACACCT GCTCCATGTG TGAGGTTTTT 12 60 

TTCC7\AGCAG AAGAAGAAGA AAAGAAAAAG AAGGA?VGGCG AATCAAGAAA CAAAAGAGAA 132 0 

TCTAAGAGTA CAGCTTCCTT TGAGGAGTTG TGTAGTGAAT ACCGCAAATC CAGGAAAAAC 13 8 0 

GGACGGCTTT TTTGCACCAG AGAGAATGAC CCCATCCAGG GCCCAGATGG GAAAATGCAT 144 0 

GGCAACACCT GCTCCATGTG TGAGGCCTTC TTTCAACAAG AAGAAAGAGC AAGAGCAAAG 1500 

GCTAAAAGAG AAGCTGCAAA GGAAATCTGC AGTGAATTTC GGGACCAAGT GAGGAATGGA 1560 

ACACTTATAT GCACCAGGGA GCATAATCCT GTCCGTGGAC CAGATGGCAA AATGCATGGA 1620 

AACAAGTGTG CCATGTGTGC CAGTGTGTTC AAACTTGAAG AAGAAGAGAA GAAAAATGAT 1680 

AAAGAAGAAA AAGGGAAAGT TGAGGCTGAA AAAGTTAAGA GAGAAGCAGT TCAGGAGCTG 174 0 

TGCAGTGAAT ATCGTCATTA TGTGAGGAAT GGACGACTCC CCTGTACCAG AGAGAATGAT 18 00 

CCTATTGAGG GTCTAGATGG GAAAATCCAC GGCAACACCT- GCTCCATGTG TGAAGCCTTC 1860 

TTCCAGCAAG AAGCAAAAGA AAAAGT^GA GCTGAACCCA GAGCAAAAGT CAAAAGAGAA 1920 

GCTGAAAAGG AGACATGCGA TGAATTTCGG AGACTTTTGC AAAATGGAAA ACTTTTCTGC 1980 

ACT^GAGAAA ATGATCCTGT GCGTGGCCCA GATGGCAAGA CCCATGGCAA CAAGTGTGCC 2040 

ATGTGTAAGG CAGTCTTCCA GAAAGAAAAT GAGGAAAGAA AGAGGAAAGA AGAGGAAGAT 2100 

CAGAGAAATG CTGCAGGACA TGGTTCCAGT GGTGGTGGAG GAGGAAACAC TCAGGACGAA 2160 

TGTGCTGAGT ATCGGGAACA AATGAAAAAT GGAAGACTCA GCTGTACTCG GGAGAGTGAT 2220 

CCTGTACGTG ATGCTGATGG CAAATCGTAC AACAATCAGT GTACCATGTG TAAAGCAAAA 22 80 

TTGGAAAGAG AAGCAGAGAG AAAAAATGAG TATTCTCGCT CCAGATCAAA TGGGACTGGA 234 0 

TCAGAATCAG GGAAGGATAC ATGTGATGAG TTTAGAAGCC AAATGAAAAA TGGAAAACTT 24 00 

ATCTGCACTC GAGAAAGTGA CCCTGTCCGG GGTCCAGATG GCAAGACACA TGGTAATAAG 24 60 

TGTACTATGT GTAAGGAAAA ACTGGAAAGG GAAGCAGCTG AAAAAAAAAG AAAGAGGATG 2 520 

AAGACAGGAG CAATACAGGA GAAAGGAGCA ATACAGGAGA AAGGAGCAAT GACAAAGAGG 2 580 

ATCTGTGTCG TGAATTTCGA AGCATGCAGA GAAATGGAAA GCTTATCTGC ACCAGAGAAA 264 0 

ATAACCCTGT TCGAGGCCCA TATGGCAAGA TGCACATCAA TAAATGTGCT ATGTGTCAGA 2 700 
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GCATCTTTGA 


TCGAGAAGCT 


AATGAAAGAA 


AAAAGAAAGA 


TGAAGAGAAA 


TCAAGTAGCA 


2760 


AGCCCTCAAA 


TAATGCAAAG 


GATGAGTGCA 


GTGAATTTCG 


AAACTATATA 


AGGAACAATG 


2820 


AACTCATCTG 


CCCTAGAGAG 


AATGACCCAG 


TGCACGGTGC 


TGATGGAAAG 


TTCTATACAA 


2880 


ACAAGTGCTA 


CATGTGCAGA 


GCTGTCTTTC 


TAACAG7VAGC 


TTTGGAAAGG 


GCAAAGCTTC 


2940 


AAGAAAAACC 


ATCCCATGTT 


AGAGCTTCTC 


AAGAGGAAGA 


CAGCCCAGAC 


TCTTTCAGTT 


3000 


CTCTGGATTC 


TGAGATGTGC 


AAAGACTACC 


GAGTATTGCC 


CAGGATAGGC 


TATCTTTGTC 


3060 


CAAAGGATTT 


AAAGCCTGTC 


TGTGGTGACG 


ATGGCCAAAC 


CTACAACAAT 


CCTTGCATGC 


3120 


TCTGTCATGA 


AAACCTGATA 


CGCCAAACAA 


ATACACACAT 


CCGCAGTACA 


GGGAAGTGTG 


3180 


AGGAGAGCAG 


CACCCCAGGA 


ACCACCGCAG 


CCAGCATGCC 


CCCGTTTGAC 


GAATGACAGG 


3240 


AAGATTGTTG 


AAAGCCATGA 


GGGAAAAAAT 


AAACCCCAGT 


TTTGAATCAC 


CTACCTTCAC 


3300 


CATCTGTATA 


TACAAAGAAT 


TTTTCGGAGC 


TTGTTTTATT 


TGCTATAGAA 


AACAATACAG 


3360 


AGCTTTTGGG 


AATGGAATCA 


CTGATTTTCA 


GTCTTTTCCA 


TTTCTTTCCT 


CCTAGAATCT 


3420 


GTGATCTGAG 


GGTATAAAGA 


CATTTCCACC 


AAGTTTGAGC 


CCTCAAAATG 


TCCTGATTAC 


3480 


AATGCTGTCT 


GTCCAACTGC 


CTGTTCAATA 


AAAGTAAACT 


CAGCAGAAAA 


A 


3531 


(2) ANGABEN ZU SEQ ID 


NO: 7: 











( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 

His Glu Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO : 8: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

( B ) ART : Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Ser Glu Tyr Arg Lys Ser Arg Lys Asn Glv Arg Leu Phe 
1 5 lo" 
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(2) ANGABEN ZU SEQ ID NO: 9: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 9: 

Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 10: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Ser Glu Phe Arg Asp Gin Val Arg Asn Gly Thr Leu lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 11: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

Ser Ala Phe Arg Pro Phe Val Arg Asn Gly Arg Leu Gly 
15 10 

(2) ANGABEN ZU SEQ ID NO: 12: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 12: 

Ser Glu Tyr Arg His Tyr Val Arg Asn Gly Arg Leu Pro 
15 10 

(2) ANGABEN 2U SEQ ID NO: 13: 

( i ) S EQUENZKE^FNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

Lys Glu Tyr Glu Lys Gin Val Arg Asn Gly Arg Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 14: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

( B ) ART : Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Asp Glu Phe Arg Arg Leu Leu Gin Asn Gly Lys Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 15: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 15: 

Ser Gin Tyr Gin Asn Gin Ala Lys Asn Gly lie Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 16: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 
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(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Ala Glu Tyr Arg Glu Gin Met Lys Asn Gly Arg Leu Ser 
15 10 

(2) ANGABEN ZU SEQ ID NO: 17: 

( i ) SEQUENZKENNZEICHEN : 

<A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

Asn Glu Tyr Arg Lys Leu Val Arg Asn Gly Lys Leu Ala 
15 10 

(2) ANGABEN ZU SEQ ID NO: 18: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Asp Glu Phe Arg Ser Gin Met Lys Asn Gly Lys Leu lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 19: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

Pro Gin Asp Lys Lys Phe Phe Gin Ser Leu Asp Gly lie Met Phe lie 
15 10 15 

Asn Lys 



wo 99/33974 PCT/EP98/08424 

(2) ANGABEN ZU SEQ ID NO: 20: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 20: 

Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Met His Gly 
15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 21: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

Thr Arg Glu Asn Asp Pro Val Leu Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 

Asn Lys 

(2) ANGABEN ZU SEQ ID NO: 22: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Thr Arg Glu His Asn Pro Val Arg Gly Pro Asp Gly Lys Met His Gly 
15 10 15 



Asn Lys 



wo 99/33974 



13 
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(2) ANGABEN ZU SEQ ID NO: 23: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 

Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Arg Met His Gly 
15 10 15 

Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 24: 

( i ) SEQUENZKENNZEI CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Thr Arg Glu Asn Asp Pro lie Glu Gly Leu Asp Gly Lys lie His Gly 

15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 25: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

Thr Arg Glu Asn Asp Pro lie Arg Gly Pro Asp Gly Lys Met His Gly 
15 10 IB 

Asn Leu 



wo 99/33974 PCT/EP98/08424 

(2) ANGABEN ZU SEQ ID NO: 26: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Thr Arg Glu Asn Asp Pro Val Arg Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 

Asn Lys 

(2) ANGABEN ZU SEQ ID NO: 27: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Val His Gly 
15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 28: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 28: 

Thr Arg Glu Ser Asp Pro Val Arg Asp Ala Asp Gly Lys Ser Tyr Asn 
15 10 15 

Asn Gin 



wo 99/33974 
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(2) ANGABEN ZU SEQ ID NO: 29: 

( i ) SEQUENZKEmZEICHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 



Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 30: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

( B ) ART : Aminosaure 

(C) STRANGFORM: Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 

Ala Thr 
1 

(2) ANGABEN ZU SEQ ID NO: 31: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 

Ala Leu 
1 

(2) ANGABEN ZU SEQ ID NO: 32: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 



(ii) ART DES MOLEKULS: Peptid 



wo 99/33974 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO 

Ala Met 
1 

(2) ANGABEN ZU SEQ ID NO: 33: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Atninosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKCtLS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO 

Ser Met 
1 

(2) ANGABEN ZU SEQ ID NO: 34: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2 Aminosauren 

(B) T^T: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO 

Thr Met 
1 
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